查看原文
其他

Animate Anyone 人物图片生成动画

renee创业狗 Renee 创业随笔
2024-10-09

这两天有个新的论文《Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for Character Animation》发布。代码还没有开源,所以还不能使用,但是可以先看论文:https://arxiv.org/abs/2311.17117

先看效果

他们的方法概述如下: 

首先,姿态序列首先使用Pose Guider进行编码,并与多帧噪声融合。

其次,由Denoising UNet进行视频生成的去噪过程。Denoising UNet的计算块由空间注意力、交叉注意力和时间注意力组成,如右侧虚线框中所示。参考图像的整合涉及两个方面:

  1. 通过ReferenceNet提取详细特征,并用于空间注意力。
  2. 通过CLIP图像编码器提取语义特征,用于交叉注意力。时间注意力在时间维度上操作。

最后,VAE解码器将结果解码为视频剪辑。

看看不同效果

实体人

卡通人

人形

还可以看看不同技术方法的对比:

继续滑动看下一个
Renee 创业随笔
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存